云课堂(10) | MicrobiomeAnalyst在线绘图教程
一直关注联川公众号的小伙伴们都知道,联川云平台已于2018年12月6日正式上线( http://cloud.lc-bio.com:5390/index.html);
还没使用过的小伙伴,赶紧点开大显身手一番~使用指南详情请戳此链接:联川生物云平台使用指南;
联川云平台包含FAQ/SOP和云平台双重功能:丰富的FAQ/SOP,助你快速上手入门,更有详尽的分析技能小技巧等你来学习;云平台中包含科研中经常用到的分析绘图软件,可对实验数据进行统计分析、绘图等。
今天小编将与大家一起分享云平台里的MicrobiomeAnalyst在线绘图教程,一起学起来吧~
新一代测序技术的广泛应用使微生物组研究发生了革命性的变化,通过对微生物群落的遗传内容进行高通量分析。如何分析产生的大型复杂数据集仍然是当前微生物学研究的一个关键挑战。MicrobiomeAnalyst就是下游的统计分析和功能解释一个极佳的选择。
http://www.microbiomeanalyst.ca/,界面十分友好,无需注册,直接可用。该软件主要包括四个模块,MDP Marker Data Profiling (MDP):16S 扩增子分析综合工具,包括了 alpha 多样性、beta 多样性、微生物组间比较、功能预测等最新最主流的分析展示方法。ITS 数据只要符合格式也能进行分析。SDP Shotgun Data Profiling (SDP): 宏基因组数据分析。包括了 KEGG、COG 注释,功能分析等众多工具。TSEA Taxon Set Enrichment Analysis (TSEA):富集分析。工具为临床手工集合了许多病原菌的信息生成一个数据集,可以在工具中搜索相关菌株信息。PPD Projection with Public Data (PPD): 和公共数据库(数据来源主要 为 HMP 等人体微生物组数据库,也有 EMP 等的一些环境微生物组数据库)中的数据集进行 比较,可能发现潜在的模式变化。
我们以 16S 扩增子测序结果为例:
1.首先准备 3 个文件,文件 1 是各样本对应的 OTU 丰度表,但首行首列位置必须填写#NAME。文件 2 是样本类型,第二列为分组名称,首行首列位置也必须填写#NAME。文件3 是 OTUid 对应的不同层级的注释结果,首行首列位置要填写#TAXONOMY。Taxonomy labels 填写 Not Specific/Other 即可。
2.能得到的基本信息包括 OTU 的数目以及样本的的序列数,也可以导出相应的表格和图;
3.按照提示,修改参数,筛选需要的 OTU 进行后续分析;
4.关于数据归一化的问题,确认是否需要抽平以及数据是否需要标准化,一般选默认即可。
Data rarefying:选择是否抽平序列至最小样本量
Data scaling:选择数据标准化方法,有不标准化、TSS、CSS、UQ 可选,常用 TSS 或 CSS
Data transformation:选择数据是否进行数据变换(标准化)
5.数据的整理与展示,该部分主要包括 6 大部分,包括文章中主要的图和表:
Visual exploration:可视化,主要是样本相对丰度柱状图或饼形图展示
Community profiling:样本整体分析,包括α、β多样性分析和核心微生物分析
Clustering analysis:聚类分析,主要是不同分类水平的热图、树图分析
Differential abundance analysis:差异比较
Biomarker analysis:生物标记物挖掘,LEfse 和随机森林
Functional potentials:功能预测
1)Stacked bariarea plot 展示可以选择不同分类级别 taxonomic level;可以选择面积图或堆积柱状图;可以选择 4 种颜色配置方案 color scheme;可以选择展示哪些样本/分组/单独样本 View type;最后可以选择合并低 counts 的注释结果。确认完毕后还可以导出图片以及丰度表;
2)Interactive piechart exploration 左边可以展示上一层级物种,右边可以展示左边任一层级的下一层分类,其中还可以设置单个样本还是所有样本,也可以合并低丰度;
3)Alpha diversity profiling & significance testing Alpha 多样性和显著性检验。可选择不同的 level 和显著性检验算法,导出不同类型的图片;
4)Beta Diversity & Significance Testing beta 多样性分析,同样可以选择多种分类法PCoA/NMDS;距离算法bray-curtis/Unifrac(weighted 和 unweighted);和统计方法PERMANOVA/ANOSIM 等,可以分组加标签或者分别展示;
5)Core Microbiome 核 心 微 生 物 分 析 , 可 以 看 到 组 间 主 要 的 核 心 微 生 物 。 可以 设 置 不 同 层 级 , 也 可 以 设 置 各 种 阈 值 。
6)Hierarchical Clustering & Heatmap Visualization 是聚类热图,可以设置聚类或者不聚类,也可以设置聚类的距离算法、颜色设置以及展示不同的层级。
7)Dendrogram 聚 类 建 树 。 同 样 提 供 了 包 括 利 用 bray-curtis 距 离 等 在 的 聚类 方 法 。
8) Correlation Analysis 相 关 分 析 , 包 括 了 主 流 的 pearson 和 spearman 相关 系 数 的 算 法 。
9) Pattern Search 模 式 分 析 。 以 某 一 物 种 ( 比 如 自 身 实 验 关 注 的 物 种 ) 为 参考 , 分 析 与 其 他 物 种 ( 各 层 级 均 可 ) 的 关 系 , Details 是 差 异 不 同 分 组 差 异分 析 的 结 果 。
10)Univariate Statistical Comparisons 自带两种单变量统计方法,基本够我们平时使用,Details 是 差 异 不 同 分 组 差 异 分 析 的 结 果 。
metagenomeSeq:一 种 算 法 , 用 在 疾 病 领 域 丰 度 较 低 的 情 况 , 查 看 ? 就 能看 到 具 体 的 信 息 ;可 以 按 照 自 身 样 本 特 性 尝 试 分 析 。也 是 一 种 组 间 差 异 分 析方 法 。RNAseq 分 析 :包 括 了 EdgeR 和 DESeq2 算 法 .用 来 检 验 组 间 的 不 同分 类 水 平 的 差 异 。一 般 情 况 下 ,16S 扩 增 子 项 目 还 是 使 用 Univariate StatisticalComparisons 来进行差异分析。
11)通过调整 p 值以及 LDA 值,可以展示出 top25 差异显著的菌群;
12)Random Forests 随 机 森 林 分 析 , 样 本 量 较 大 ( 15 个 ) 的 情 况 下 使 用 , 样 本量 少 随 机 穷 举 的 时 候 会 显 示 不 出 差 异 。 工 具 还 可 显 示 对 模 型 的 贡 献 程 度 。
13)Prediction for Greengenes Annotated OTUs (PICRUSt)
PICRUSt 功能预测仅能适配 greengene 数据库的注释 ID,还需要重新使用 2012.5.18的 Geengen 版本进行物种注释。
14)Predicting the functional capabilities of microbial communities using Tax4FunTax4Fun 配套的物种注释的数据库是 SILVA,与 PICRUSt 不能混用。
重要的部分来了:分析过程中,好多数据好多展示图片还要一个一个下载很麻烦?注意右下角的 Downloads 图标,点进去后,刚刚做的所有分析在这里均有记录,可以一个一个下载,或者 download.zip 下载全部数据。最神奇的是点击 Generate Report,直接可以生成完整分析报告。包括了刚才展示的主要结果、分析流程、统计方法,还有相关引文。分析报告在Analysis Report 中直接查看。
MicrobiomeAnalyst在线绘图教程就分享完了,除了本教程联川云平台还有很多小技能供学习哦~下载本教程请至云平台:http://cloud.lc-bio.com:5390/faq/sop_detail.php?id=121 或直接点击文末左下角“阅读原文”下载~
云平台目前只针对联川客户开放,注册需用正确的合同号进行注册哦,有多个合同的填写任意一个合同号即可。暂不能体验的小伙伴也别着急,随着平台的优化,也会逐步对全员开发的~注册链接如下:
http://cloud.lc-bio.com:5390/app/signin.html
MicrobiomeAnalyst在线绘图教程原文的小伙伴请点击文末‘阅读原文’下载哦~
也欢迎给位给我们的云平台留言、提建议
在大家的督促下,我们的云平台会越做越好
MEGA软件下载安装&序列处理&进化树绘制&Newick格式介绍
云平台 | bio-Venn在线绘制Venn图